1.15. Офисные форматы
Офисные форматы
DOC (Document) – стандартный редактируемый офисный формат документов. Отличается тем, что позволяет использовать широкий набор инструментов по форматированию текста, следить за орфографией, грамматикой, пунктуацией, формировать документ по шаблону, добавлять таблицы, изображения, сноски и многое другое.
- DOC – бинарный формат Word (до 2003);
- DOCX – XML-основанный формат (Office Open XML);
- ODT – открытый формат OpenDocument (LibreOffice);
- DOCM – с поддержкой макросов;
- DOT/DOTX – шаблоны документов.
В 1983 году компания Microsoft представила первый текстовый процессор под названием Multi-Tool Word (позже переименован в Microsoft Word ) для MS-DOS. Формат .DOC стал родным форматом Word. Он был бинарным, то есть содержал данные в нечитаемом человеком виде, что позволяло эффективно хранить сложные элементы, вроде стилей, таблиц, изображений, формул, колонтитулов и списков.
В 2003 году Microsoft объявила новый формат — Office Open XML (OOXML) , который получил расширение .docx (для документов), .xlsx (Excel) и .pptx (PowerPoint). Начиная с Microsoft Office 2007 , .docx становится основным форматом по умолчанию. Однако поддержка старого .doc сохранялась через специальный пакет совместимости.
Формат ODT (OpenDocument) был создан консорциумом OASIS и позже принят как международный стандарт ISO/IEC 26300 с целью противостоять проприетарному формату OOXML и сделать офисные документы более переносимыми и независимыми от одного производителя.
Борьба Microsoft и сообщества открытых стандартов привели к «форматной войне», которая закончилась ничьей - оба формата приняты как международные стандарты.
RTF (Rich Text Format) – кроссплатформенный формат с базовым форматированием, читаем как обычный текст с RTF-разметкой. До появления современных текстовых процессоров данные хранились в виде простого текста (TXT) или в формате RTF (Rich Text Format), который позволял хранить базовое форматирование. RTF был разработан Microsoft в 1987 году как кроссплатформенный формат для обмена документами между разными текстовыми редакторами.
PDF (Portable Document Format) – стандарт для обмена документами, сохраняющий точное форматирование, может содержать текст, векторную и растровую графику, формы и аннотации.
В начале 1980-х годов, с развитием персональных компьютеров и настольных издательских систем, стало очевидно, что документы выглядят по-разному в зависимости от текстового редактора, установленных шрифтов, принтеров, ОС.
Компания Adobe Systems, основанная Джоном Уорноком и Чарльзом Гешке, работала над технологией описания страниц — языком PostScript, который позволял точно описывать содержимое страницы для печати. И в 1991 году Adobe начала разработку нового формата, который должен был стать платформенно-независимым и сохранять точное оформление документа при передаче между различными устройствами. Первый официальный выпуск состоялся в 1993 году вместе с запуском программы Adobe Acrobat.
Форматы электронных книг поддерживают оглавление, метаданные, встроенные изображения (иллюстрациия) и даже стили:
- FB2 – XML-основанный формат электронных книг;
- EPUB – открытый стандарт электронных книг.
FB2 (сокр. от FictionBook 2) разработан в России в середине 2000-х годов группой энтузиастов. Основной идеей было создать человекочитаемый, легко парсимый и структурированный формат, специально ориентированный на художественную литературу.
EPUB — это международный открытый стандарт для электронных книг, основанный на веб-технологиях: XHTML, CSS, XML и ZIP. Разрабатывался как единая альтернатива закрытым форматам, таким как Amazon MOBI или Kindle Format 8. Сейчас именно EPUB используется в Apple Books, Google Play, и многих программных читалках (FBReader, Calibre, Moon+ Reader).